"将注意力旋转90°":深入浅出解读 Kimi 最新出圈成果
"将注意力旋转90°":深入浅出解读 Kimi 最新出圈成果前几天,一篇来自Kimi的论文「ATTENTION RESIDUALS」在 AI 圈引发了激烈讨论——马斯克罕见地发出评价:"Impressive work from Kimi"。同时,两位前Openai大佬也同样发出了高度评价,OpenAI 「推理模型之父」Jerry Tworek表示“深度学习2.0时代即将到来”。
前几天,一篇来自Kimi的论文「ATTENTION RESIDUALS」在 AI 圈引发了激烈讨论——马斯克罕见地发出评价:"Impressive work from Kimi"。同时,两位前Openai大佬也同样发出了高度评价,OpenAI 「推理模型之父」Jerry Tworek表示“深度学习2.0时代即将到来”。
2026年3月26日彭博独家爆料,AI独角兽Moonshot AI(月之暗面)正处于考虑在香港进行IPO的早期阶段,计划登陆香港资本市场。
3 月 20 日,知名 AI 代码编辑器 Cursor 高调发布了所谓的编程模型 Composer 2,结果被网友质疑「套壳」 Kimi K2.5。而从官方口径来看, Composer 2 的性能简直是降维打击:全基准大幅领先前代,首次引入持续预训练,叠加大规模强化学习,能解决需要数百个操作的高难度编程任务。
今日凌晨,在英伟达GTC大会上,月之暗面创始人杨植麟作为本届唯一受邀现场演讲的中国独立大模型公司创始人,发表题为《How We Scaled Kimi K2.5》的演讲,首次完整披露Kimi K2.5背后的技术路线图。
上午的时候,企业微信官方上线 OpenClaw
近期,多家国内模型厂商先后推出对标 OpenClaw 的产品,Mini Max 推出的 MaxClaw,Kimi 推出的 Kimi Claw,显然,OpenClaw 所展现出的 AI 执行力,以及开发者们对 AI 执行结果所展现出来的包容程度让市场看到了价值空间。
刚刚,阿里云Coding Plan订阅服务全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型。用户订阅套餐后,可在Qwen Code、Claude Code、Cline、OpenClaw等AI工具上自由切换使用这些模型,享受更稳定、Tokens额度更高的模型服务。
独家获悉,月之暗面(以下简称“月暗”)已对内部组织架构进行调整。曾经以 C 端产品 Kimi 为主的团队中,负责 API 服务对接的员工一度只有个位数,而如今,随着调用需求激增,该 API 团队正在快速扩编,并以独立业务分支的形式存在,直接向总裁张予彤汇报。
好好好,年刚过完,「龙虾肉」就先被Kimi夹走了一口。一周前刚上线支持一键部署的Kimi Claw,转头就在OpenClaw模型调用榜上冲到TOP1。Kimi近20天的收入,直接卷过去年全年,估值一路飙至700亿元。
这次的 Kimi Claw,其实已经把 ClawHub 里的 Skills 全都接进来了。你可以直接用一句话,让它在浏览器里把需要的 Skills 装到云端环境里,不用自己折腾配置,也不用手动一堆步骤。